临床研究基线均衡性比较除了用P值大小来反映，还可以用这种方法！

郑卫军医学论文与统计分析 2022-10-07

统计小食系列

（1）数据不是正态分布还能做t检验吗？

（2）当正态、偏态、率的数据狭路相逢，如何绘制规范医学论文表格？

（3）基本统计研究七宗罪，你犯了几条？来投个票吧

（4）方差分析后两两比较，究竟应该用哪种方法？

（5）再论“数据不是正态时，是否可以采用t检验？”

（6）“我的研究是基于量表的调查，如何计算样本量？”

（7）两组均数比较，可以用方差分析吗？谈谈结果一样的那些统计方法。

（8）趋势性检验还不会做？来看看最基本的趋势性检验方法

统计小食（9）

均衡性原则是指除了处理因素不同外，其他对观察结果有影响的因素应尽量一致。

组间基线资料的均衡性是为了保证反应变量观察结果的组间可比性，以便在相似的基线条件下考察处理因素对观察结果的真实影响。目前基线资料均衡性的检验方法常用的是假设检验。

根据P值判断是否均衡其实不那么可靠！

假设检验的目的是通过样本对总体进行推断，而基线均衡性比较的目的是比较样本间的可比性，因此前者的意义在总体层面，后者的意义则在样本层面上。另外根据假设检验和样本量的关系可知，即使样本实际的均衡性没有变化，随着样本量的减少，检验效能降低，也会得出较大的 P 值，即均衡性变好的假相，所以通过假设检验得出的基线“均衡”是不可靠的。此时，如果预先对基线数据进行组间比较，作者可能会选择性不报告组间差异有统计学意义的变量，而导致选择性报告偏倚。

因此在随机对照试验中，很多基线比较，干脆不需要提供假设检验和P值的结果。因为这是多余，P值是否小于0.05都不能很好说明是否均衡。

怎么办？我推荐标准化差异法 ( standardized difference )

而标准化差异法不再注重P值，而注重实际差别。标准化差异的定义由 Flury 和 Reidwyl 在 1986 年首次提出。

对于连续性变量，其算法是:

可以看出，标准化差值，其实根据两组数据的均数和标准差，将差值转为类似于z值的d值。

对于分类变量，它的算法是

一般地，当标准化差异小于 0.1 时，认为组间该变量的均衡性较好。这一点可见于大部分的文献，有心的朋友今后可以留意一下。

总结来说，

假设检验P值，在小样本时，对不均衡性不敏感；对大样本又过于铭感。标准化差异正是在小样本情况下也可以检验出基线资料不均衡性的方法。标准化差异同时适用于连续型变量和分类变量的均衡性比较，且不受度量衡的影响。标准化差异的优点还在于可以量化指标差异的大小，也可以结合示意图直观地表示。

标准化差异不仅可以用于一般组间差异性比较，还可以用于倾向评分的差异性比较和基于加权的倾向评分比较，不会受到样本量，特别是加权之后样本量的变动影响。

案例分析

比如2019年最新出版的研究慢性肾病的大队列研究中，就是用了标准化率的方法。该研究基于逆概率加权的方法进行匹配研究。